Was ist chi quadrat verteilung?

Chi-Quadrat-Verteilung

Die Chi-Quadrat-Verteilung (auch χ²-Verteilung genannt) ist eine stetige Wahrscheinlichkeitsverteilung, die in der Statistik häufig verwendet wird. Sie ist besonders wichtig bei Hypothesentests und der Konstruktion von Konfidenzintervallen.

Definition:

Die Chi-Quadrat-Verteilung ist die Verteilung einer Summe von Quadraten standardnormalverteilter Zufallsvariablen. Wenn Z₁, Z₂, ..., Zₖ unabhängige, standardnormalverteilte Zufallsvariablen sind (d.h. Zᵢ ~ N(0,1)), dann folgt die Zufallsvariable X, definiert als:

X = Z₁² + Z₂² + ... + Zₖ²

einer Chi-Quadrat-Verteilung mit k Freiheitsgraden. Man schreibt X ~ χ²(k).

Parameter:

Die Chi-Quadrat-Verteilung hat einen einzigen Parameter: die Anzahl der Freiheitsgrade (k). Die Freiheitsgrade bestimmen die Form der Verteilung. Im Allgemeinen gilt: je höher die Anzahl der Freiheitsgrade, desto "normalverteilter" wird die Chi-Quadrat-Verteilung. Mehr über Freiheitsgrade.

Eigenschaften:

  • Nicht-negativ: Die Chi-Quadrat-Verteilung nimmt nur nicht-negative Werte an (da sie die Summe von Quadraten ist).
  • Asymmetrisch: Die Verteilung ist rechtsschief, besonders bei niedrigen Freiheitsgraden. Mit zunehmenden Freiheitsgraden nähert sie sich einer Normalverteilung.
  • Erwartungswert: Der Erwartungswert der Chi-Quadrat-Verteilung ist gleich der Anzahl der Freiheitsgrade: E(X) = k.
  • Varianz: Die Varianz der Chi-Quadrat-Verteilung ist gleich dem Doppelten der Anzahl der Freiheitsgrade: Var(X) = 2k.

Anwendungen:

Die Chi-Quadrat-Verteilung findet breite Anwendung in der Statistik, insbesondere:

  • Hypothesentests:
    • Chi-Quadrat-Anpassungstest (Goodness-of-Fit Test): Testet, ob eine Stichprobe aus einer bestimmten Verteilung stammt. Mehr über Chi-Quadrat-Anpassungstest.
    • Chi-Quadrat-Unabhängigkeitstest: Testet, ob zwei kategoriale Variablen unabhängig voneinander sind. Mehr über Chi-Quadrat-Unabhängigkeitstest.
  • Konfidenzintervalle: Zur Konstruktion von Konfidenzintervallen für die Varianz einer normalverteilten Population.
  • Varianzanalyse (ANOVA): In bestimmten Formen der Varianzanalyse.

Wahrscheinlichkeitsdichtefunktion (PDF):

Die Wahrscheinlichkeitsdichtefunktion der Chi-Quadrat-Verteilung ist gegeben durch:

f(x; k) = (x^(k/2 - 1) * e^(-x/2)) / (2^(k/2) * Γ(k/2))

wobei:

  • x ≥ 0
  • k > 0 ist die Anzahl der Freiheitsgrade.
  • Γ ist die Gammafunktion.

Kumulative Verteilungsfunktion (CDF):

Die kumulative Verteilungsfunktion (CDF) gibt die Wahrscheinlichkeit an, dass eine Chi-Quadrat-verteilte Zufallsvariable einen Wert kleiner oder gleich x annimmt. Sie wird oft in Tabellen oder mit Statistiksoftware berechnet.

Verwendung in Software:

Statistiksoftwarepakete wie R, Python (mit Bibliotheken wie SciPy) und SPSS verfügen über Funktionen zur Berechnung von Wahrscheinlichkeiten, Quantilen und Zufallszahlen im Zusammenhang mit der Chi-Quadrat-Verteilung.